数据框是一个表或二维类似数组的结构,其中每列包含一个变量的值,每行包含来自每一列的一组值。
以下是数据框的特征 -
列名称应该不为空。
行名称应该是唯一的。
存储在数据帧中的数据可以是数字,因子或字符类型。
每列应包含相同数量的数据项。
创建数据框
> x<-data.frame(id=c(1:5),name=c("may","juy","cat","hyi","hhu"),birthdate=as.Date(c("1990-09-08","1990-08-07","1990-07-02","1990-06-12","1990-02-23")))
> x
id name birthdate
1 1 may 1990-09-08
2 2 juy 1990-08-07
3 3 cat 1990-07-02
4 4 hyi 1990-06-12
5 5 hhu 1990-02-23
获取数据帧的结构
通过使用str()
函数可以查看数据帧的结构,参考以下代码实现 -
> str(x)
'data.frame': 5 obs. of 3 variables:
$ id : int 1 2 3 4 5
$ name : Factor w/ 5 levels "cat","hhu","hyi",..: 5 4 1 3 2
$ birthdate: Date, format: "1990-09-08" "1990-08-07" "1990-07-02" ...
据帧数据摘要
数据的统计摘要和性质可以通过应用summary()
函数获得。
> summary(x)
id name birthdate
Min. :1 cat:1 Min. :1990-02-23
1st Qu.:2 hhu:1 1st Qu.:1990-06-12
Median :3 hyi:1 Median :1990-07-02
Mean :3 juy:1 Mean :1990-06-23
3rd Qu.:4 may:1 3rd Qu.:1990-08-07
Max. :5 Max. :1990-09-08
扩展数据帧
可以通过添加列和行来扩展数据帧。
添加列
只需使用新的列名来添加列向量。参考以下示例代码 -
> x$age<-c(12,12,23,34,45)>
x
id name birthdate age
1 1 may 1990-09-08 12
2 2 juy 1990-08-07 12
3 3 cat 1990-07-02 23
4 4 hyi 1990-06-12 34
5 5 hhu 1990-02-23 45
添加行
要将更多行永久添加到现有数据帧,需要使用与现有数据帧相同结构的新行,并使用rbind()
函数。
在下面的示例中,我们使用新行创建一个数据帧,并将其与现有的数据帧进行合并,以创建最终的数据帧。
> y<-data.frame(id=c(6),name=c("tyu"),birthdate=as.Date(c("1988-09-09")),age=c(34))
> y
id name birthdate age
1 6 tyu 1988-09-09 34
> t<-rbind(x,y)
> t
id name birthdate age
1 1 may 1990-09-08 12
2 2 juy 1990-08-07 12
3 3 cat 1990-07-02 23
4 4 hyi 1990-06-12 34
5 5 hhu 1990-02-23 45
6 6 tyu 1988-09-09 34
如何使用R软件重新定义变量
R语言学习笔记:dplyr程序包
R语言玩转诊断性研究
建立自己的描述性统计函数:基于R自定义函数
如何快、准、狠使用R语言完成单因素方差分析
R中强大的apply、tapply、lapply、sapply、mapply家族
R语言常用数据类型
R作图也是杠杠的(1)
R入门教程之变量
R语言概述
R语言基础教程之运算符
R语言基础教程之运算符
R语言决策结构,if语句,if..else语句
R语言基础教程之字符串
R语言基础教程之矩阵